Biến thể đơn nucleotide là gì? Các bài nghiên cứu khoa học

Biến thể đơn nucleotide (SNP) là sự thay thế một nucleotide duy nhất trong trình tự DNA, xuất hiện phổ biến trong bộ gen người và các loài sinh vật khác. Một vị trí được coi là SNP nếu biến thể đó xuất hiện với tần suất từ 1% trở lên trong quần thể và có thể ảnh hưởng đến gen hoặc đặc điểm sinh học.

Định nghĩa và bản chất của biến thể đơn nucleotide (SNP)

Biến thể đơn nucleotide, viết tắt là SNP (Single Nucleotide Polymorphism), là một loại biến dị di truyền xảy ra khi một nucleotide duy nhất trong chuỗi DNA bị thay đổi. Trong bộ gen người, nếu tại một vị trí cụ thể có thể xuất hiện một trong hai bazơ nitrogen khác nhau ở các cá thể khác nhau – ví dụ, A thay cho G – thì vị trí đó được gọi là một SNP.

Theo tiêu chuẩn khoa học, một biến thể chỉ được phân loại là SNP nếu tần suất xuất hiện của biến thể ít phổ biến hơn đạt ít nhất 1% trong quần thể. Nếu thấp hơn ngưỡng này, nó được gọi là đột biến hiếm (rare mutation). SNP thường là biến thể trung tính, không ảnh hưởng đến chức năng sinh học, nhưng cũng có thể liên quan đến bệnh lý, khả năng đáp ứng thuốc, hoặc đặc điểm sinh học cụ thể.

Dưới đây là ví dụ minh họa về SNP trong một đoạn DNA:

Cá thể A...AATGCTAGGTC...
Cá thể B...AATACTAGGTC...

Trong ví dụ trên, sự thay đổi từ G sang A tại một vị trí xác định là một SNP nếu nó phổ biến trong quần thể với tần suất ≥ 1%.

Cơ chế hình thành SNP

Biến thể đơn nucleotide chủ yếu phát sinh do lỗi trong quá trình sao chép DNA, khi enzym polymerase chèn nhầm một bazơ trong chuỗi mới tổng hợp. Ngoài ra, các tác nhân ngoại sinh như tia UV, hóa chất gây đột biến (mutagens), hoặc quá trình oxy hóa nội bào cũng có thể gây ra thay đổi đơn nucleotide thông qua tổn thương DNA và sửa chữa không chính xác.

Sau khi xảy ra, một SNP chỉ được duy trì nếu nó không gây hại nghiêm trọng và không bị loại bỏ bởi chọn lọc tự nhiên. Trong quá trình sinh sản, SNP có thể được truyền lại cho thế hệ sau dưới dạng biến thể di truyền ổn định. Vì vậy, nhiều SNP trở thành dấu hiệu di truyền bền vững qua nhiều thế hệ.

Các dạng thay thế nucleotide phổ biến của SNP:

  • Transition: Thay đổi giữa purine ↔ purine (A ↔ G) hoặc pyrimidine ↔ pyrimidine (C ↔ T)
  • Transversion: Thay đổi giữa purine ↔ pyrimidine (A/G ↔ C/T)

Transition thường chiếm khoảng 2/3 số SNP do chúng ít gây biến đổi cấu trúc DNA hơn transversion.

Phân loại SNP theo vị trí trong genome

SNP được phân loại dựa trên vị trí xuất hiện trong bộ gen. Phổ biến nhất là hai loại: SNP nằm trong vùng mã hóa (coding region) và SNP nằm ngoài vùng mã hóa (non-coding region). Coding SNPs có thể ảnh hưởng trực tiếp đến trình tự axit amin của protein, trong khi non-coding SNPs ảnh hưởng đến biểu hiện gen thông qua điều hòa phiên mã hoặc dịch mã.

Các nhóm SNP chính theo vị trí:

  • Synonymous SNPs: Không làm thay đổi axit amin trong chuỗi protein
  • Nonsynonymous SNPs: Làm thay đổi axit amin, chia tiếp thành missense (thay đổi một axit amin) và nonsense (tạo mã kết thúc sớm)
  • Intronic SNPs: Nằm trong các intron, có thể ảnh hưởng đến quá trình cắt nối RNA
  • Regulatory SNPs: Nằm ở promoter, enhancer hoặc vùng điều hòa microRNA – ảnh hưởng đến biểu hiện gen

Một số SNP tuy không nằm trong vùng mã hóa nhưng lại tác động đáng kể đến biểu hiện gen, ví dụ như SNP rs12740374 trong vùng enhancer của gen SORT1 có liên quan đến cholesterol máu và nguy cơ bệnh tim mạch.

Tần suất và phân bố SNP trong bộ gen người

SNP là dạng biến dị phổ biến nhất trong bộ gen người. Có hơn 100 triệu SNP đã được ghi nhận trong cơ sở dữ liệu dbSNP của NCBI. Trung bình, cứ khoảng 1000 cặp base thì có một SNP, nhưng phân bố này không đồng đều trong toàn bộ bộ gen.

SNP có xu hướng tích tụ nhiều hơn tại các vùng không mã hóa, vùng gen ít biểu hiện hoặc các đoạn DNA lặp lại. Ngược lại, các vùng gen thiết yếu như exon của gen bảo tồn cao thường có tần suất SNP thấp do áp lực chọn lọc tự nhiên loại bỏ các biến thể bất lợi.

Ví dụ về phân bố SNP (ước lượng):

Vị tríTần suất SNP
Exon bảo tồn cao< 1 SNP/10,000 bp
Intron hoặc vùng xen kẽ1 SNP/1,000–2,000 bp
Vùng lặp không mã hóa1 SNP/500–1,000 bp

Đặc điểm phân bố này giúp các nhà nghiên cứu chọn lựa SNP phù hợp trong các nghiên cứu liên kết gen hoặc phân tích di truyền trong quần thể.

Ý nghĩa sinh học và y học của SNP

Dù phần lớn SNP là biến thể trung tính không ảnh hưởng đến chức năng sinh học, một số SNP có thể làm thay đổi trình tự protein, mức độ phiên mã gen hoặc cấu trúc mạch điều hòa, từ đó tác động đến chức năng sinh lý của cơ thể. Chính vì vậy, SNP là nhân tố quan trọng trong nghiên cứu di truyền học người và y học chính xác.

Nhiều SNP đã được phát hiện có liên quan đến các bệnh lý phức tạp như ung thư, tim mạch, tiểu đường, bệnh lý thần kinh và tự miễn. Chẳng hạn, SNP rs1333049 trên locus 9p21 có liên quan đến nguy cơ nhồi máu cơ tim. Hay SNP rs429358 trong gen APOE quyết định kiểu hình APOE4, một yếu tố nguy cơ cao đối với bệnh Alzheimer.

Vai trò của SNP trong y học:

  • Dự đoán nguy cơ di truyền đối với bệnh
  • Phân tích tính di truyền trong gia đình
  • Phát triển marker chẩn đoán và điều trị
  • Xác định tính nhạy cảm thuốc trong dược lý di truyền

Các nghiên cứu GWAS (Genome-Wide Association Studies) đã sử dụng hàng triệu SNP để tìm ra liên kết giữa biến thể di truyền và đặc điểm bệnh học ở người. Đây là nền tảng cho y học cá thể hóa hiện đại.

Ứng dụng của SNP trong nghiên cứu di truyền

SNP là dấu hiệu di truyền lý tưởng trong các nghiên cứu quần thể, phân tích tiến hóa và cải tiến giống nhờ đặc tính bền vững, phổ biến và dễ phát hiện. SNP giúp xây dựng bản đồ di truyền, theo dõi quá trình tái tổ hợp, và phát hiện locus liên kết với tính trạng.

Trong chọn giống cây trồng và vật nuôi, SNP được ứng dụng trong:

  • Phân biệt giống và nhận dạng di truyền
  • Chọn lọc marker liên kết với tính trạng mong muốn
  • Xây dựng sơ đồ phả hệ di truyền

Ví dụ, trong nông nghiệp chính xác, các nhà khoa học dùng SNP để chọn giống lúa chịu hạn bằng cách xác định SNP liên kết với gen kiểm soát cơ chế đóng mở khí khổng.

Trong nhân chủng học, SNP giúp truy nguyên tổ tiên, phân tích dòng gen, cấu trúc quần thể và sự di cư của loài người thông qua các công ty như 23andMe hoặc AncestryDNA.

Kỹ thuật phát hiện và phân tích SNP

Việc phát hiện SNP yêu cầu độ chính xác và độ phân giải cao. Ngày nay, các kỹ thuật hiện đại cho phép sàng lọc và xác định hàng triệu SNP trong một lần thử nghiệm với chi phí thấp và độ tin cậy cao. Các phương pháp phổ biến:

  • NGS (Next-Generation Sequencing): Giải trình tự toàn bộ genome để phát hiện biến thể mới và hiện có
  • SNP microarray: Dùng chip chứa oligonucleotide đặc hiệu để lai với DNA mẫu
  • Allele-specific PCR: Phát hiện SNP bằng phản ứng PCR chuyên biệt cho từng allele
  • TaqMan assay: Dùng đầu dò huỳnh quang để phát hiện allele cụ thể

Phân tích dữ liệu SNP quy mô lớn thường sử dụng các phần mềm như GATK (Genome Analysis Toolkit), PLINK, hoặc bcftools. Các phần mềm này cho phép thực hiện lọc biến thể, phân tích liên kết, gán kiểu gen, và thống kê theo quần thể.

Công thức tính tần suất allele từ dữ liệu SNP:

f(A)=2NAA+NAa2Nf(A) = \frac{2N_{AA} + N_{Aa}}{2N}, trong đó NAAN_{AA} là số cá thể đồng hợp tử, NAaN_{Aa} là dị hợp tử, và NN là tổng số cá thể.

Vai trò của SNP trong dược lý di truyền

SNP là nền tảng của dược lý di truyền (pharmacogenomics) – lĩnh vực nghiên cứu sự khác biệt di truyền ảnh hưởng đến phản ứng với thuốc. Một số SNP ảnh hưởng đến enzyme chuyển hóa thuốc, làm tăng hoặc giảm hoạt tính dược lý hoặc nguy cơ tác dụng phụ.

Ví dụ điển hình:

  • SNP rs4244285 trong gen CYP2C19: Ảnh hưởng đến việc chuyển hóa clopidogrel – thuốc chống đông máu
  • SNP rs1045642 trong gen ABCB1: Ảnh hưởng đến sự hấp thụ thuốc ức chế miễn dịch tacrolimus
  • SNP trong gen VKORC1: Điều chỉnh liều warfarin – thuốc chống đông máu

FDA Hoa Kỳ đã công bố danh sách các biomarker dược lý, bao gồm SNP, trên nhãn thuốc chính thức (FDA Pharmacogenomics Table). Một số xét nghiệm di truyền như GeneSight hay OneOme được thương mại hóa để hướng dẫn kê đơn chính xác.

Hạn chế và thách thức trong nghiên cứu SNP

Dù mang lại nhiều tiềm năng, nghiên cứu và ứng dụng SNP vẫn đối mặt với các thách thức khoa học và kỹ thuật. Đầu tiên là số lượng SNP khổng lồ, đòi hỏi năng lực xử lý dữ liệu lớn và thuật toán hiệu quả để phân tích. Thứ hai, không phải SNP nào cũng có ý nghĩa chức năng rõ ràng; nhiều SNP là trung tính hoặc chỉ liên kết mà không có quan hệ nhân quả với bệnh.

Một số khó khăn phổ biến:

  • Đa yếu tố: Bệnh thường không do một SNP đơn lẻ mà do tương tác giữa nhiều SNP và yếu tố môi trường
  • Dịch sai kết quả: Nhiều SNP có liên kết thống kê nhưng không có chức năng sinh học rõ rệt
  • Khác biệt quần thể: Tần suất SNP và liên kết có thể thay đổi theo chủng tộc, gây khó khăn khi áp dụng trên quy mô toàn cầu
  • Rủi ro về đạo đức và quyền riêng tư dữ liệu di truyền

Để vượt qua những thách thức này, các nhà khoa học đang kết hợp dữ liệu SNP với các lớp dữ liệu khác như biểu hiện gen, epigenomics và proteomics để có cái nhìn toàn diện hơn về chức năng sinh học.

Tài liệu tham khảo

  1. NCBI dbSNP – Single Nucleotide Polymorphism Database
  2. Nature Reviews Genetics – The Genetics of SNPs
  3. Genome.gov – SNP Definition
  4. PubMed – SNPs: Impact on Gene Function and Disease
  5. Pharmacogenomics – Role of SNPs in Personalized Medicine
  6. FDA – Pharmacogenomic Biomarkers in Drug Labeling
  7. EBI – GWAS Catalog

Các bài báo, nghiên cứu, công bố khoa học về chủ đề biến thể đơn nucleotide:

QUY TRÌNH GIẢI TRÌNH TỰ SANGER MỘT SỐ BIẾN THỂ ĐA HÌNH ĐƠN NUCLEOTIDE TRÊN CÁC GEN PNPLA3, TM6SF2, MBOAT7 VÀ GCKR LIÊN QUAN ĐẾN BỆNH GAN NHIỄM MỠ KHÔNG DO RƯỢU
Tạp chí Y học Việt Nam - Tập 513 Số 2 - 2022
Mục tiêu: Xây dựng quy trình giải trình tự Sanger khảo sát năm biến thể trên các gen PNPLA3, TM6SF2, MBOAT7 và GCKR liên quan đến bệnh gan nhiễm mỡ không do rượu (NAFLD). Đối tượng và phương pháp nghiên cứu: Tối ưu hóa quy trình ly trích DNA có ly giải hồng cầu bằng dung dịch ACK, thiết kế 5 cặp đoạn mồi đặc hiệu cho các biến thể, tối ưu hóa nhiệt độ bắt cặp của phản ứng PCR và tối ưu hóa phản ứng...... hiện toàn bộ
#Giải trình tự Sanger #bệnh gan nhiễm mỡ không do rượu #PNPLA3 #TM6SF2 #MBOAT7 và GCKR
Mô hình biểu hiện khác biệt của hai isoform gen TNFSF15 trong ung thư đại tràng ở người Dịch bởi AI
Digestive Diseases and Sciences - Tập 64 - Trang 1857-1867 - 2019
Gen thành viên 15 của siêu gia đình yếu tố hoại tử khối u (TNFSF15) liên quan đến sự phát triển của một số loại ung thư. Gen này mã hóa hai protein: phân tử liên kết yếu tố hoại tử khối u 1A (TL1A) và ức chế tăng trưởng nội mạch 192 (VEGI-192). Thụ thể chính cho TL1A là thụ thể chết 3 (DR3). Chúng tôi đã nghiên cứu sự biểu hiện của các bản sao mã hóa của TL1A, VEGI-192 và DR3 ở các giai đoạn khác ...... hiện toàn bộ
#ung thư đại tràng #TNFSF15 #TL1A #VEGI-192 #DR3 #không ổn định microsatellite #biến thể đơn nucleotide
Các mối liên hệ của biến thể đơn nucleotide với ung thư đại trực tràng nhầy: phân tích biến thể chung toàn bộ bộ gen và biến thể hiếm dựa trên gen Dịch bởi AI
Biomarker Research - Tập 6 - Trang 1-10 - 2018
Ung thư đại trực tràng có tác động đáng kể đến cá nhân và hệ thống chăm sóc sức khỏe. Nhiều gen đã được xác định ảnh hưởng đến quá trình sinh bệnh của nó. Tuy nhiên, cơ sở di truyền của mô học khối u nhầy, một loại phụ ác tính của ung thư đại trực tràng, hiện vẫn chưa được biết đến nhiều. Nghiên cứu này nhằm xác định các biến thể di truyền chung và hiếm có liên quan đến kiểu hình khối u nhầy. Dữ l...... hiện toàn bộ
Các biến thể đơn nucleotide rs7903146 và rs12255372 trong gen yếu tố phiên mã 7 như 2 có liên quan đến nguy cơ gia tăng mắc tiểu đường thai kỳ ở phụ nữ Ai Cập? Dịch bởi AI
Journal of Genetic Engineering and Biotechnology - Tập 19 - Trang 1-8 - 2021
Các biến thể di truyền trong gen yếu tố phiên mã 7 như 2 (TCF7L2) có liên quan đến tiểu đường loại 2 (T2D) và tiểu đường thai kỳ (GDM) ở nhiều quần thể, nhưng còn thiếu số liệu thống kê về GDM ở phụ nữ Ai Cập. Mục tiêu của nghiên cứu này là đánh giá tác động của hai đa hình rs7903146 và rs12255372 trong gen TCF7L2 đối với sự phát triển của GDM ở phụ nữ Ai Cập. Chúng tôi đã tuyển chọn 114 phụ nữ ma...... hiện toàn bộ
#tiểu đường thai kỳ #gen TCF7L2 #đa hình đơn nucleotide #phụ nữ Ai Cập
Biến thể đơn nucleotide rs30187 của ERAP1 không làm tăng nguy cơ bệnh ở trẻ em miền Bắc Ấn Độ mắc viêm khớp liên quan đến viêm gân Dịch bởi AI
Clinical Rheumatology - Tập 36 - Trang 1161-1165 - 2017
Biến thể đơn nucleotide (SNP) của ERAP1 liên quan đến bệnh viêm khớp dính khớp. Dữ liệu về SNP của ERAP1 trong viêm khớp thiếu niên nguyên phát (JIA) là rất khan hiếm. SNP rs30187 của ERAP1 đã được chỉ ra là có nguy cơ trong nhóm viêm khớp liên quan đến viêm gân (ERA) trong JIA. Chúng tôi đã kiểm tra tỷ lệ mắc và mối liên quan của SNP này ở trẻ em Ấn Độ mắc ERA. Các SNP trong ERAP1 (rs30187) đã đư...... hiện toàn bộ
#ERAP1 #biến thể đơn nucleotide #viêm khớp dính khớp #viêm khớp thiếu niên nguyên phát #tần suất alen #Dịch tễ học
Phát triển các biến thể đơn nucleotide (SNP) trong Phaseolus vulgaris và các loài Phaseolus liên quan Dịch bởi AI
Molecular Breeding - Tập 33 - Trang 531-544 - 2013
Trong nghiên cứu này, các marker SNP mới đã được phát triển cho đậu phổ biến (Phaseolus vulgaris L.) và các loài Phaseolus liên quan. Chiến lược áp dụng trình bày những khía cạnh mới và thú vị, chẳng hạn như việc lựa chọn các mẫu vật được sử dụng, nhằm nắm bắt một phần lớn sự đa dạng di truyền hiện có trong đậu phổ biến, đặc biệt tập trung vào các vật liệu hoang dã và thuần hóa từ Mesoamerica và v...... hiện toàn bộ
#đậu phổ biến #biến thể đơn nucleotide #SNP #di truyền học #thuần hóa #đa dạng di truyền #Phaseolus
Biến thể đơn nucleotide trong vùng không dịch mã 3′ của LPP là yếu tố nguy cơ cho ung thư phổi: một nghiên cứu bệnh-chứng Dịch bởi AI
BMC Cancer - Tập 19 - Trang 1-11 - 2019
Các biến thể đơn nucleotide (SNPs) trong vùng không dịch mã 3′ (UTR) của các gen liên quan đến sự bám dính và di chuyển của tế bào có thể ảnh hưởng đến sự gắn kết của miRNA và có khả năng ảnh hưởng đến nguy cơ ung thư. Nghiên cứu hiện tại nhằm mục đích sàng lọc các SNP trong vùng 3′ UTR của các gen liên quan đến ung thư và điều tra sự đóng góp của chúng vào mẫn cảm với ung thư phổi. Bảy SNP đã đượ...... hiện toàn bộ
#Biến thể đơn nucleotide #ung thư phổi #vùng không dịch mã 3′ #LPP #TNS3.
Nghiên cứu sự liên kết của các biến thể đơn nucleotide (SNP) của gen SPO11 với vô sinh nam vô căn ở quần thể người Hán Trung Quốc Dịch bởi AI
Springer Science and Business Media LLC - Tập 28 - Trang 731-736 - 2011
Nghiên cứu nhằm điều tra tỷ lệ biến thể đơn nucleotide (SNP) ở gen SPO11 và ảnh hưởng của nó đến vô sinh nam vô căn tại Trung Quốc. Các yếu tố vô sinh như rối loạn giải phẫu, miễn dịch và nhiễm trùng đã được xem xét trong việc chọn lựa bệnh nhân vô sinh nam vô căn. Phân tích tinh dịch định kỳ đã được thực hiện. DNA được tách chiết từ máu ngoại vi của các bệnh nhân được chọn và nhóm đối chứng, và n...... hiện toàn bộ
#SPO11 #SNP #vô sinh nam vô căn #quần thể người Hán #Trung Quốc
Biến thể một nucleotide của gen FSHβ liên quan đến các đặc điểm sinh sản ở cá bơn Nhật Bản (Paralichthys olivaceus) Dịch bởi AI
Journal of Ocean University of Qingdao - Tập 9 - Trang 395-398 - 2010
Hormon kích thích nang trứng β (FSHβ) của cá bơn Nhật Bản (Paralichthys olivaceus) đóng vai trò quan trọng trong việc điều chỉnh sự phát triển của tuyến sinh dục. Nghiên cứu này nhằm mục đích điều tra các đặc điểm di truyền phân tử của gen FSHβ và giải thích tác động của các biến thể nucleotide đơn (SNP) của FSHβ đến các đặc điểm sinh sản ở cá bơn Nhật Bản. Chúng tôi đã sử dụng phản ứng chuỗi poly...... hiện toàn bộ
#FSHβ #cá bơn Nhật Bản #biến thể nucleotide đơn #đặc điểm sinh sản #testosterone #chỉ số gonadosomatic
Một biến thể nucleotide đơn tại nhiễm sắc thể 2q21.3 (LCT −13910C>T) liên quan đến kết quả lâm sàng sau ghép tế bào gốc huyết học đồng loại Dịch bởi AI
Blood - Tập 112 - Trang 2156-2159 - 2008
Tóm tắt Biến thể nucleotide đơn (SNP) liên quan đến hiện tượng bảo tồn lactase (LCT −13910C>T) làm thay đổi hệ vi sinh vật đường ruột. Xét đến ảnh hưởng của vi sinh vật có hại trên các tác động miễn dịch khác nhau, chúng tôi đã thử nghiệm DNA từ 111 người nhận/người hiến và phân tích xem liệu SNP này có ảnh hưởng đến sự sống sót và tỷ lệ mắc bệnh ...... hiện toàn bộ
Tổng số: 17   
  • 1
  • 2